SPSS 数据集教程 1 – 基础

作者:Ruben Geert van den Berg,发表于 SPSS 博客

简介

SPSS 数据集的逻辑并非总是那么直观。但是,要高效地使用数据集,掌握一些基本概念就足够了。本教程将对此进行讲解。

本教程重点介绍 如何使用 SPSS 数据集。关于数据集的定义和背景知识,请参阅 SPSS 数据集

使用 SPSS 数据集

  • 建议您跟随本教程中的步骤进行操作。您可以复制并运行我们将在 idols.savservice_provider.sav 上使用的 语法 (syntax)
  • 我们将首先把 CD (current directory, 当前目录) 设置为文件所在的文件夹。接下来,我们将打开其中一个文件并计算一些测试变量。
* 设置工作目录并打开数据文件。.
CD 'd:/downloads'.
GET FILE 'idols.sav'.

未命名数据集 (Untitled Datasets)

SPSS 未命名数据集SPSS 中的未命名数据集

  • 请注意左上角的空方括号。这意味着这是一个未命名数据集 (untitled dataset)。这是因为我们没有为其分配名称。
  • 未命名数据集的一个特点是,只要打开另一个数据集,它就会关闭。对其所做的任何更改都将被丢弃。
  • 为了快速演示,运行 GET FILE 'service_provider.sav'. 。您会看到前一个数据集现在已被一个新的(未命名的)数据集替换。

已命名数据集 (Named Datasets)

  • 可以通过使用 DATASET NAME 命令来命名数据集,防止数据集被关闭。
  • 数据集名称不需要用引号括起来,并且必须符合变量的命名规则。
* 打开 idols.sav 并将名称应用于数据集。.
GET FILE 'idols.sav'.
DATASET NAME idols_data.

* 打开 service_provider.sav 并将名称应用于数据集。.
GET FILE 'service_provider.sav'.
DATASET NAME service_data.

* 计算测试变量。.
COMPUTE test_0 = 0.
EXECUTE.

现在您有两个打开的数据集。第一个数据集在打开第二个数据集时没有关闭,因为已为其应用了一个名称 (“idols_data”)。

活动数据集 (Active Dataset)

SPSS 活动数据集SPSS 中的活动数据集

  • 在之前的语法中,我们还计算了一个新的变量。经过检查,您会看到它存在于 service_data 中,但不存在于 idols_data 中。
  • 这是因为当我们运行 COMPUTE 命令时,service_data 是活动数据集 (active dataset)
  • 默认情况下,活动数据集通常是您最后打开或点击的数据。在 Windows 任务栏中,可以通过其图标中的红色叉号来识别活动数据集。
  • 如果要在非活动数据集上运行语法,我们首先需要激活它。不要通过点击它来执行此操作。
* 在 idols_data 中计算测试变量。.
DATASET ACTIVATE idols_data.
COMPUTE test_1 = 1.
EXECUTE.

COMPUTE 命令之前激活 idols_data 可确保新变量将在此数据集中创建。

关闭 SPSS 数据集

  • 当我们完成数据操作后,我们将关闭两个数据集。(我们通常首先将它们保存为数据文件。如果不这样做,我们的更改将被丢弃。这在 SPSS 数据集 中进行了解释)。
  • 这里的一个特殊之处在于,最后一个打开的数据集实际上仍然保持打开状态。但是,它的名称会被删除,因此一旦打开其他数据,它就会消失。
  • 或者,如果您真的想将其关闭,请在关闭数据集后运行 NEW FILE.
* 关闭数据集。或者,使用 "DATASET CLOSE ALL." 代替下面的两行代码。.
DATASET CLOSE idols_data.
DATASET CLOSE service_data.

* 摆脱最后一个打开的数据集。.
NEW FILE.